智能论文笔记

Surveillance Face Anti-spoofing

Hao Fang , Ajian Liu , Jun Wan , Sergio Escalera , Chenxu Zhao , Xu Zhang , Stan Z. Li , Zhen Lei

分类：计算机视觉

2023-01-03

Face Anti-spoofing (FAS) is essential to secure face recognition systems from various physical attacks. However, recent research generally focuses on short-distance applications (i.e., phone unlocking) while lacking consideration of long-distance scenes (i.e., surveillance security checks). In order to promote relevant research and fill this gap in the community, we collect a large-scale Surveillance High-Fidelity Mask (SuHiFiMask) dataset captured under 40 surveillance scenes, which has 101 subjects from different age groups with 232 3D attacks (high-fidelity masks), 200 2D attacks (posters, portraits, and screens), and 2 adversarial attacks. In this scene, low image resolution and noise interference are new challenges faced in surveillance FAS. Together with the SuHiFiMask dataset, we propose a Contrastive Quality-Invariance Learning (CQIL) network to alleviate the performance degradation caused by image quality from three aspects: (1) An Image Quality Variable module (IQV) is introduced to recover image information associated with discrimination by combining the super-resolution network. (2) Using generated sample pairs to simulate quality variance distributions to help contrastive learning strategies obtain robust feature representation under quality variation. (3) A Separate Quality Network (SQN) is designed to learn discriminative features independent of image quality. Finally, a large number of experiments verify the quality of the SuHiFiMask dataset and the superiority of the proposed CQIL.

translated by 谷歌翻译

Towards Regression-Free Neural Networks for Diverse Compute Platforms

Rahul Duggal , Hao Zhou , Shuo Yang , Jun Fang , Yuanjun Xiong , Wei Xia

分类：计算机视觉 | 机器学习

2022-09-27

随着向设备深度学习的转变，确保在各种计算平台上的AI服务的一致行为变得非常重要。我们的工作解决了降低视力倒数的预测不一致的新兴问题：由较不准确的模型正确预测但错误地预测的测试样品。我们介绍了回归约束的神经体系结构搜索（Reg-NAS），以设计一个高度准确的模型家庭，这些模型会导致更少的负面流动。 Reg-NAS由两个组成部分组成：（1）一种新型的体系结构约束，使较大的模型能够包含较小的权重，从而最大化权重共享。这一想法源于我们的观察结果，即网络之间的重量较大会导致相似的样本预测，并导致负面量较少。（2）一种新颖的搜索奖励，在体系结构搜索指标中同时结合了TOP-1的准确性和负面翻转。我们证明，\ regnas可以在三个流行的架构搜索空间中成功找到具有很少负面额的理想体系结构。与现有的最新方法相比，Reg-NAS可实现33-48％的负面流量相对减少。

translated by 谷歌翻译

Gaia: Graph Neural Network with Temporal Shift aware Attention for Gross Merchandise Value Forecast in E-commerce

Borui Ye , Shuo Yang , Binbin Hu , Zhiqiang Zhang , Youqiang He , Kai Huang , Jun Zhou , Yanming Fang

分类：机器学习

2022-07-27

电子商务在通过互联网增强商人的能力方面已经大有帮助。为了有效地存储商品并正确安排营销资源，对他们来说，进行准确的总商品价值（GMV）预测非常重要。但是，通过数字化数据的缺乏进行准确的预测是不算平的。在本文中，我们提出了一个解决方案，以更好地预测Apay应用程序内的GMV。得益于Graph Neural网络（GNN），它具有很好的关联不同实体以丰富信息的能力，我们提出了Gaia，Gaia是一个图形神经网络（GNN）模型，具有时间移动意识注意。Gaia利用相关的电子销售商的销售信息，并根据时间依赖性学习邻居相关性。通过测试Apleay的真实数据集并与其他基线进行比较，Gaia表现出最佳性能。盖亚（Gaia）部署在模拟的在线环境中，与基线相比，这也取得了很大的进步。

translated by 谷歌翻译

Dynamic Contrastive Distillation for Image-Text Retrieval

Jun Rao , Liang Ding , Shuhan Qi , Meng Fang , Yang Liu , Li Shen , Dacheng Tao

分类：人工智能 | 自然语言处理 | 计算机视觉

2022-07-04

尽管配备的远景和语言预处理（VLP）在过去两年中取得了显着的进展，但它遭受了重大缺点：VLP型号不断增加的尺寸限制了其部署到现实世界的搜索场景（高潜伏期是不可接受的）。为了减轻此问题，我们提出了一种新颖的插件动态对比度蒸馏（DCD）框架，以压缩ITR任务的大型VLP模型。从技术上讲，我们面临以下两个挑战：1）由于GPU内存有限，在处理交叉模式融合功能期间优化了太多的负样本，因此很难直接应用于跨模式任务，因此很难直接应用于跨模式任务。。 2）从不同的硬样品中静态优化学生网络的效率效率低下，这些样本对蒸馏学习和学生网络优化具有不同的影响。我们试图从两点克服这些挑战。首先，为了实现多模式对比度学习并平衡培训成本和效果，我们建议使用教师网络估算学生的困难样本，使学生吸收了预培训的老师的强大知识，并掌握知识来自硬样品。其次，要从硬样品对学习动态，我们提出动态蒸馏以动态学习不同困难的样本，从更好地平衡知识和学生的自学能力的困难的角度。我们成功地将我们提出的DCD策略应用于两个最先进的视觉语言预处理模型，即vilt和仪表。关于MS-Coco和FlickR30K基准测试的广泛实验显示了我们DCD框架的有效性和效率。令人鼓舞的是，与现有的ITR型号相比，我们可以至少加快推断至少129美元的$ \ times $。

translated by 谷歌翻译

PASH at TREC 2021 Deep Learning Track: Generative Enhanced Model for Multi-stage Ranking

Yixuan Qiao , Hao Chen , Jun Wang , Yongquan Lai , Tuozhen Liu , Xianbin Ye , Xin Tang , Rui Fang , Peng Gao , Wenfeng Xie

分类：自然语言处理

2022-05-18

This paper describes the PASH participation in TREC 2021 Deep Learning Track. In the recall stage, we adopt a scheme combining sparse and dense retrieval method. In the multi-stage ranking phase, point-wise and pair-wise ranking strategies are used one after another based on model continual pre-trained on general knowledge and document-level data. Compared to TREC 2020 Deep Learning Track, we have additionally introduced the generative model T5 to further enhance the performance.

translated by 谷歌翻译

Explainable COVID-19 Infections Identification and Delineation Using Calibrated Pseudo Labels

Ming Li , Yingying Fang , Zeyu Tang , Chibudom Onuorah , Jun Xia , Javier Del Ser , Simon Walsh , Guang Yang

分类：计算机视觉 | 机器学习

2022-02-11

在过去的两年中，Covid-19-19的到来引起的动荡继续带来新的挑战。在这次COVID-19大流行期间，需要快速鉴定感染患者和计算机断层扫描（CT）图像中感染区域的特定描述。尽管已迅速建立了深层监督的学习方法，但图像级和像素级标签的稀缺性以及缺乏可解释的透明度仍然阻碍了AI的适用性。我们可以识别受感染的患者并以极端的监督描绘感染吗？半监督的学习表明，在有限的标记数据和足够的未标记数据下，表现出了有希望的表现。受到半监督学习的启发，我们提出了一种模型不可静止的校准伪标记策略，并将其应用于一致性正则化框架下，以生成可解释的识别和描述结果。我们通过有限的标记数据和足够的未标记数据或弱标记数据的组合证明了模型的有效性。广泛的实验表明，我们的模型可以有效利用有限的标记数据，并为临床常规中的决策提供可解释的分类和分割结果。该代码可从https://github.com/ayanglab/xai covid-11获得。

translated by 谷歌翻译

Swin Transformer for Fast MRI

Jiahao Huang , Yingying Fang , Yinzhe Wu , Huanjun Wu , Zhifan Gao , Yang Li , Javier Del Ser , Jun Xia , Guang Yang

分类：人工智能 | 计算机视觉 | 机器学习

2022-01-10

磁共振成像（MRI）是一种重要的非侵入性临床工具，可以产生高分辨率和可重复的图像。然而，高质量的MR图像需要长时间的扫描时间，这导致患者的疲惫和不适，由于患者的自愿运动和非自愿的生理运动，诱导更多人工制品。为了加速扫描过程，通过K空间欠采样和基于深度学习的重建的方法已经推广。这项工作引进了SwinMR，这是一种基于新型的Swin变压器的快速MRI重建方法。整个网络由输入模块（IM）组成，特征提取模块（FEM）和输出模块（OM）。 IM和OM是2D卷积层，并且FEM由级联的残留的Swin变压器块（RSTBS）和2D卷积层组成。 RSTB由一系列SWIN变压器层（STL）组成。 STL的Shifted Windows多头自我关注（W-MSA / SW-MSA）在移位的窗口中执行，而不是整个图像空间中原始变压器的多头自我关注（MSA）。通过使用灵敏度图提出了一种新的多通道损耗，这被证明是为了保留更多纹理和细节。我们在Calgary-Campinas公共大脑MR DataSet中进行了一系列比较研究和消融研究，并在多模态脑肿瘤细分挑战2017年数据集中进行了下游分段实验。结果表明，与其他基准方法相比，我们的SwinMR实现了高质量的重建，并且它在噪音中断和不同的数据集中显示了不同的遮光罩掩模的稳健性。该代码在https://github.com/ayanglab/swinmr公开使用。

translated by 谷歌翻译

Incremental Cross-view Mutual Distillation for Self-supervised Medical CT Synthesis

Chaowei Fang , Liang Wang , Dingwen Zhang , Jun Xu , Yixuan Yuan , Junwei Han

分类：计算机视觉

2021-12-20

由于成像装置的约束和操作时间的高成本，电脑断层扫描（CT）扫描通常以低帧内分辨率获取。改善切片内分辨率对人类专家和计算机辅助系统的疾病诊断有益。为此，本文建立了一种新型医疗切片合成，以增加切片分辨率。考虑到临床实践中始终缺乏地面真理中间医学切片，我们介绍了以自我监督的学习方式实现这项任务的增量跨视图相互蒸馏策略。具体而言，我们从三种不同的视图模型在这种情况下，从不同视图中学到的模型可以蒸馏有价值的知识来引导彼此的学习过程。我们可以重复此过程以使模型通过增加切片分辨率来综合中间切片数据。为了证明所提出的方法的有效性，我们对大型CT数据集进行了全面的实验。定量和定性比较结果表明，我们的方法通过清晰的边缘来占据最先进的算法。

translated by 谷歌翻译

QU-BraTS: MICCAI BraTS 2020 Challenge on Quantifying Uncertainty in Brain Tumor Segmentation -- Analysis of Ranking Metrics and Benchmarking Results

Raghav Mehta , Angelos Filos , Ujjwal Baid , Chiharu Sako , Richard McKinley , Michael Rebsamen , Katrin Dätwyler , Raphael Meier , Piotr Radojewski , Gowtham Krishnan Murugesan

分类：计算机视觉 | 机器学习

2021-12-19

深度学习（DL）模型为各种医学成像基准挑战提供了最先进的性能，包括脑肿瘤细分（BRATS）挑战。然而，局灶性病理多隔室分割（例如，肿瘤和病变子区）的任务特别具有挑战性，并且潜在的错误阻碍DL模型转化为临床工作流程。量化不确定形式的DL模型预测的可靠性，可以实现最不确定的地区的临床审查，从而建立信任并铺平临床翻译。最近，已经引入了许多不确定性估计方法，用于DL医学图像分割任务。开发指标评估和比较不确定性措施的表现将有助于最终用户制定更明智的决策。在本研究中，我们探索并评估在Brats 2019-2020任务期间开发的公制，以对不确定量化量化（Qu-Brats），并旨在评估和排列脑肿瘤多隔室分割的不确定性估计。该公制（1）奖励不确定性估计，对正确断言产生高置信度，以及在不正确的断言处分配低置信水平的估计数，（2）惩罚导致更高百分比的无关正确断言百分比的不确定性措施。我们进一步基准测试由14个独立参与的Qu-Brats 2020的分割不确定性，所有这些都参与了主要的Brats细分任务。总体而言，我们的研究结果证实了不确定性估计提供了分割算法的重要性和互补价值，因此突出了医学图像分析中不确定性量化的需求。我们的评估代码在HTTPS://github.com/ragmeh11/qu-brats公开提供。

translated by 谷歌翻译

Robust Weakly Supervised Learning for COVID-19 Recognition Using Multi-Center CT Images

Qinghao Ye , Yuan Gao , Weiping Ding , Zhangming Niu , Chengjia Wang , Yinghui Jiang , Minhao Wang , Evandro Fei Fang , Wade Menpes-Smith , Jun Xia

分类：计算机视觉 | 机器学习

2021-12-09

世界目前正在经历持续的传染病大流行病，该传染病是冠状病毒疾病2019（即covid-19），这是由严重的急性呼吸综合征冠状病毒2（SARS-COV-2）引起的。计算机断层扫描（CT）在评估感染的严重程度方面发挥着重要作用，并且还可用于识别这些症状和无症状的Covid-19载体。随着Covid-19患者的累积数量的激增，放射科医师越来越强调手动检查CT扫描。因此，自动化3D CT扫描识别工具的需求量高，因为手动分析对放射科医师耗时，并且它们的疲劳可能导致可能的误判。然而，由于位于不同医院的CT扫描仪的各种技术规范，CT图像的外观可能显着不同，导致许多自动图像识别方法的失败。因此，多域和多扫描仪研究的多域移位问题是不可能对可靠识别和可再现和客观诊断和预后至关重要的至关重要。在本文中，我们提出了Covid-19 CT扫描识别模型即Coronavirus信息融合和诊断网络（CIFD-NET），可以通过新的强大弱监督的学习范式有效地处理多域移位问题。与其他最先进的方法相比，我们的模型可以可靠，高效地解决CT扫描图像中不同外观的问题。

translated by 谷歌翻译